Características series de tiempo

Santiago Bohorquez Correa

Universidad EAFIT
Escuela de Economía y Finanzas

Agregación temporal

  • En general los econometristas trabajamos con tres tipos de datos:
    • Corte transversal: Muchos individuos en un solo momento del tiempo
    • Series de tiempo: Un individuo observado a través del tiempo.
    • Panel de datos: Muchos individuo, observados por varios periodos de tiempo.

  • Cuando tenemos series de tiempo se puede hablar de mediciones en tiempo continuo y tiempo discreto.
  • Nosotros trabajaremos en este curso en tiempo discreto. Ya que por lo general las series económicas son solo observadas en periodos dados.
  • Inclusive las series financieras de alta frecuencia son consideradas en tiempo discreto, e.g. los precios intra-día de una acción se observan solo cuando se hace una venta pero no se observa el precio entre ventas.

  • El periodo de observación de los datos juega un papel importante en el manejo de las series, e.g. como veremos más adelante los efectos estacionales observados en una serie mensual difieren de una trimestral y los modelos escogidos para cada una dependerán de esto.
  • Esto es conocido como agregación temporal.

  • Un supuesto importante de este tipo de datos requiere que los datos sean observados en periodos de tiempo divididos en intervalos iguales.
  • Es decir, se espera que los datos sean observados durante todo el periodo de estudio.

Introducción a los procesos Estocásticos

Para hacer predicciones sobre series económicas y testear teorías sobre su comportamiento, necesitamos hacer unos supuestos sobre su comportamiento:

  • Consideramos que existen leyes económicas que explican el comportamiento y la interacción de estas series.
  • También existen componentes aleatorios inexplicables, debido a shocks al sistema, errores de los agentes, y distorsiones creadas por errores de medición, y agregación de agentes, bienes y tiempo.

Sea \(x_t\) un vector de variables económicas de tamaño \(m \times 1\) generadas en el tiempo \(t\). Estas variables pueden estar correlacionadas contemporáneamente y a través del tiempo. La colección \(\{ x_t, -\infty < t < \infty \}\) es llamada una secuencia (vectorial) aleatoria.

Un data set económico es un conjunto finito , e.g. \(\left\{x_1,\dots,x_n\right\}\), de esta secuencia infinita.

Proceso Generador de datos

Definimos el proceso generador de datos (PGD) para estas variables como la función de probabilidad conjunta bajo la cual esta secuencia es generada, representando todas las influencias resaltadas.

Gracias al hecho que el tiempo siempre fluye en la misma dirección, eventos pasados pueden ser tratados como dados para la explicación de eventos futuros. Esto es llamado condicionamiento secuencial y es fundamental para hacer predicciones.

Asumamos, por simplicidad, que los datos tienen una función de distribución continua. Entonces, el PGD es representado por la densidad condicional

\[\begin{equation}\label{eq:PGD} D_t\left(x_{t} | \chi_{t} \right) \end{equation}\]

donde \(\chi_t=\sigma(x_{t-1},x_{t-2},x_{t-3},\dots)\). Esta notación es una simplificación para el \(\sigma\)-algebra representando el conocimiento del pasado del sistema. \(\chi_t\) es el \(\sigma\)-algebra más pequeño bajo el cual las variables aleatorias \(x_{t-j}\) son medibles para todo \(j \geq 0\)

En la ecuación la densidad \(D_t\) depende de \(t\), porque no asumimos estacionariedad, en particular debemos hacer concesiones para características como variaciones estacionales, cambios de régimen, cambios regulatorios, entre otros.

Estos conceptos los veremos en futuras clases.

PGD y Modelos

Un modelo econométrico dinámico es una familia de funciones de los datos que pretenden imitar aspectos del PGD, ya sea \(D_t\) o funciones derivadas de \(D_t\) como los momentos.

Formalmente, un modelo es una familia de funciones

\[\begin{equation} \left\{ M \left(x_t,x_{t-1},x_{t-2}.\dots,d_t;\psi\right), \psi \in \Psi \right\}, \Psi \subseteq \mathbb{R}^p \end{equation}\]

Los modelos dependen de una colección de parámetros, de cantidad \(p\), denominados por \(\psi\), y \(\Psi\) son los valores admisibles de los parámetros (espacio parámetrico). El vector \(d_t\) son variables tratadas como no-estocásticas, que tratan de capturar cambios en el PGD a través del tiempo.

  • Puede parecer sorprendente que el PGD no se represente dependiendo de \(\Psi\). Esto es debido a que la parametrización es una característica del modelo y no explícitamente del PGD.
  • Un punto importante para resaltar es que pueden existir diferentes parametrizaciones para el PGD y estas pueden ser de interés para diferentes propósitos.
  • El supuesto de especificación correcta del modelo, dice que existe un modelo que es idéntico al PGD.

Modelos

Por lo general, se considera uno de los siguientes modelos: \[\begin{align} X_t = T_t + C_t + S_t + I_t \\ X_t = T_t \times C_t \times S_t \times I_t \end{align}\] donde \(X_t\) es la series observada, \(T_t\) es la tendencia de largo plazo, \(C_t\) es el ciclo económico, \(S_t\) es el componente estacional, e \(I_t\) las variaciones residuales.

  • Los modelos de estimación que veremos en clase por lo general trataran de modelar el componente \(C_t\) que es de interés económico.
  • A menos que sea explícitamente modelado, e.g. modelos estacionales, los componentes \(T_t\) y \(S_t\) se toman como dados.
  • La decisión sobre cual ecuación tomar como base es basada en conocimiento sobre el fenómeno estudiado.

Conceptos básicos

Rezago Variable

  • El primer rezago de una variable \(x_t\) se define como \(x_{t-1}\).
  • De la misma forma el rezago \(j\) de \(x_t\) es \(x_{t-j}\).
  • Cabe anotar que el rezago depende de la unidad de medida de la variable, e.g. si la variable esta medida anualmente \(t-1\) es el año anterior, pero si esta medida mensualmente, \(t-1\) es el mes anterior.

El operador de rezagos

Sea \(x_t\) una observación aleatoria de una serie de tiempo. Definimos el símbolo \(L\) como:

\[\begin{equation} L x_t = x_{t-1} \end{equation}\]

\(L\) es lo que en matemáticas es conocido como un operador. No es un parámetro o un número pero puede ser tratado como tal para operaciones algebraicas, e.g. \(L^2 x_t = L(L x_t) = L x_{t-1} = x_{t-2}\), en general \(L^n x_t = x_{t-n}\)

En adición, la expresión

\[\begin{equation} \alpha(L) = \alpha_0 + \alpha_1 L + \alpha_2 L^2 + \dots + \alpha_p L^p \end{equation}\]

es llamado el polinomio de orden p del operador de rezagos.

Y si lo aplicamos a un serie de tiempo, generamos una media móvil ponderada de la serie, i.e.

\[\begin{equation} \alpha(L)x_t = \alpha_0 + \alpha_1 x_{t-1} + \alpha_2 x_{t-2} + \dots + \alpha_p x_{t-p} \end{equation}\]

El operador de diferencia

Otro operador usado es

\[\begin{equation} \Delta = 1 - L \end{equation}\]

el operador de diferencia. \(\Delta x_t = x_t - x_{t-1}\) es el cambio en \(x\) en el periodo \(t\).

Es importante anotar la diferencia de notación entre

\[\begin{equation} \Delta_n = 1 - L^n \end{equation}\]

que el operador de la diferencia de \(n\) periodos, y

\[\begin{equation} \Delta^n = (1 - L)^n \end{equation}\]

el operador de la diferencia de orden \(n\), e.g. \(\Delta_2 x_t = x_t - x_{t-2}\) y \(\Delta^2 x_t= \Delta x_t - \Delta x_{t-1} = (x_t - x_{t-1}) - (x_{t-1} - x_{t-2})\)

  • La primera diferencia del logaritmo de \(x_t\) es \(\Delta \ln (x_t) = \ln (x_t) - \ln (x_{t-1})\).
  • El cambio porcentual de una serie de tiempo \(x_t\) entre los periodos \(t-1\) y \(t\) es aproximadamente \(100*\Delta \ln (x_t)\). Esta aproximación funciona mejor cuando el cambio porcentual es pequeño.Demostración
  • Es común usar esta aproximación para anualizar crecimientos, por ejemplo con datos trimestrales, se obtiene así, \(4*100*\Delta \ln (x_t)\).

Cambio porcentual

  • El cambio del logaritmo de una variable es aproximadamente igual al cambio proporcional de dicha variable, i.e. \(\ln (X + a) - \ln (X) \cong \frac{a}{X}\).
  • Ahora, remplazando \(X\) con \(x_{t-1}\) y \(a\) con \(\Delta x_t\). Y, sabiendo que, \(x_t = x_{t-1} + \Delta x_t\).
  • Esto significa que el cambio proporcional entre los periodos \(t\) y \(t-1\) es aproximadamente, \[\begin{equation} \Delta \ln (x_t) = \ln (x_t) - \ln (x_{t-1}) = \ln (x_{t-1} + \Delta x_t) - \ln (x_{t-1}) \cong \frac{\Delta x_t}{x_{t-1}}</li> </ul> \begin{frame}{Proceso de innovación} Finalmente, definimos el proceso de innovación . Sea $\{\varepsilon, -\infty < t < \infty \}$ un proceso estocástico (o secuencia aleatoria) y sea $\mathcal{E}_{t-1}$ el $\sigma$-algebra de eventos predecibles cuando el pasado de $\varepsilon_t$ es conocido. Y asumimos \begin{align} E(\varepsilon_t | \mathcal{E}_{t-1}) & = 0 \\ E(\varepsilon^2_t | \mathcal{E}_{t-1}) & = \sigma^2 \end{align} Este es un proceso estacionario en el sentido débil, y no auto-correlacionado. Este tipo de proceso se conoce también como {\it ruido blanco} \end{frame} \section{Correlación} \frame{\tableofcontents[currentsection]} \begin{frame}{Correlación} \begin{itemize} \item Una de las principales características de las series de tiempo es la presencia de Auto-correlación o correlaci£n serial. \item Ustedes posiblemente están familiarizados con el concepto de correlación entre dos variables, la auto-correlación implica correlación entre la serie y su pasado. \end{itemize} \end{frame} \begin{frame}{Correlación}\label{Autoco} \begin{block}{\emph{Autocovarianza:}} Si la secuencia aleatoria $\{x_t\}$ tiene media $E[x_t]=\mu_t$ la autocovarianza esta dada por: \begin{equation} \begin{matrix} cov[x_{t_1},x_{t_2}] & = & E[(x_{t_1}-\mu_{t_1})(x_{t_2}-\mu_{t_2})] \\ & = & E[(x_{t_1}x_{t_2})] - \mu_{t_1}\mu_{t_2} \\ & & \hyperlink{Prueba:ac}{\beamergotobutton{Demostración}} \end{matrix} \end{equation}\]

    \end{block}

    \end{frame}